Model Selection

8-bit quantized inference

# 8-bit quantized inference

Qwen3 30B A3B Gptq 8bit

Qwen3 30B A3B is a large language model that has undergone 8-bit quantization using the GPTQ method, suitable for efficient inference scenarios.

Large Language Model

Josiefied Qwen3 8B Abliterated V1 8bit

An optimized 8-bit quantized version of Qwen3-8B, designed for efficient inference on the MLX framework

Large Language Model

Stable Diffusion 3.5 Large Turbo Openvino 8bit

An 8-bit quantized version of Stable Diffusion 3.5 Large Turbo, converted to OpenVINO format for efficient text-to-image generation tasks.

Text-to-Image English

LLAMA 3 Quantized

The 8-bit quantized version of Meta Llama 3 - 8B Instruct large language model, reducing model size and improving inference speed, suitable for deployment on resource-constrained devices.

Large Language Model

Pinokio_v1.0 is a text generation model supporting English and Turkish, released under the Apache-2.0 license.

Large Language Model

Transformers Supports Multiple Languages

Featured Recommended AI Models

AIbase

Empowering the Future, Your AI Solution Knowledge Base

English 简体中文繁體中文にほんご

© 2025AIbase